Le champ de l'inférence
L'inférence statistique concerne les affirmations sur les caractéristiques de la mesure de probabilité vraie et sous-jacente. Elle utilise les données observées pour réduire les possibilités et déterminer quelle distribution spécifique (ou famille de distributions) a produit la variation que nous voyons. Que nous soyons en train d'estimer un paramètre $s$ ou de prédire une valeur future $X$, nous cherchons à résoudre l'ambiguïté de la source.
Le lien entre description et inférence
Bien qu'elles soient souvent perçues comme de simples synthèses, des méthodes comme le calcul de la moyenne d'échantillon $\bar{x}$ sont en réalité les premières étapes pour inférer la localisation de la densité de population véritable.
Exemple : Étude de transplantation cardiaque de Stanford (5.1.1)
Dans l'étude fondamentale menée par Turnbull, Brown et Hu (1974), les chercheurs ont examiné si un programme de transplantation cardiaque à Stanford produisait bien le résultat escompté (meilleure survie). Examiner simplement les temps de survie bruts ($X$) de un ou deux patients était insuffisant.
- Groupe témoin : Patients recevant des soins standards.
- Groupe traitement : Patients recevant des greffes.
Les chercheurs ont eu besoin de l'inférence pour déterminer si les différences de survie étaient statistiquement significatives ou simplement le résultat de la variation stochastique inhérente à la santé individuelle des patients.
La double nature de l'incertitude
Nous devons reconnaître un piège critique dans l'analyse : l'incertitude n'est pas un « bruit » monolithique. Elle provient de deux sources distinctes :
- Variation intrinsèque : Modélisée par la probabilité (par exemple, le hasard d'un jet de pièce ou la diversité biologique).
- Ignorance structurelle : La réalité selon laquelle nous ne pouvons pas recueillir suffisamment d'observations pour connaître avec précision absolue les modèles de probabilité corrects.